新型コロナウイルスの蛋白質構造情報を集約して3/11から公開

新型コロナウイルスの蛋白質構造情報を集約して3/11から公開

大阪大学から蛋白質構造データベース(PDB)を正確に発信中

2020-3-10自然科学系

研究成果のポイント

・大阪大学蛋白質研究所の日本蛋白質構造データバンク(Protein Data Bank Japan:PDBj)が、紛らわしい類縁ウイルスの情報を除き、新型コロナウイルス感染症(COVID-19) に関連した構造情報データのみを正確に集約して情報発信
・新型コロナウイルス関連のPDBデータをインターネット上で一般に3/11に公開(毎週水曜日9:00amに世界同時更新)
・新薬開発の情報基盤となる国際的な蛋白質構造データベース拠点が国内に存在する利点を活かして、信頼性の高い情報を日本語で発信することで、創薬研究が加速することを期待。

概要

大阪大学蛋白質研究所の日本蛋白質構造データバンク(Protein Data Bank Japan:PDBj 代表栗栖源嗣教授) では、アジアの代表機関として、新型コロナウイルス(Severe Acute Respiratory Syndrome Coronavirus 2:SARS-CoV-2)の新しく解析された蛋白質構造情報を蛋白質構造データベース(Protein Data Bank:PDB) に登録しました。また、3月11日(水)の定期データ更新に合わせて、新型コロナウイルス特集ページを作成し、関連するPDBデータを研究者が利用しやすいように集約して公開しました (図1) 。特集ページには,毎週水曜日(日本時間9:00am)に最新エントリーが追加されます。

SARS-CoV-2に対する構造研究は、新型コロナウイルスの国際的な分類基準が確立する前からスタートしています。そこで、PDBjでは、登録した研究者に対し個別に確認をとり、データ検証と編集・登録作業の過程で正確な情報を収集し、SARS-CoV-2の蛋白質情報の精度を高め、信頼度の高いデータを登録しました。

PDBjが提供するデータベースには、SARS-CoV-2の他にも類縁ウイルスに由来するタンパク質の構造情報が沢山収録されています(ウイルス、微生物、植物、動物がもつ蛋白質・核酸など総データ数16万件以上)。その中でよく似た構造を排し、今回の新型コロナウイルス(SARS-CoV-2)に直接関係あるエントリーだけを厳密に抽出してデータ提供します。

本特集ページは,2020年3月11日(水)午前9時(日本時間)にPDBjのホームページ( https://pdbj.org )から一般に公開されました。

図1 新型コロナウイルスの構造情報特集ホームページ
PDBに登録されている合計16万件以上の情報の中から新型コロナウイルスSARS-CoV-2株がもつタンパク質情報だけを正確に抽出して提供。

研究の背景

蛋白質構造データベース(Protein Data Bank:PDB) は実験的に決定した生体高分子の3次元構造を保存する世界で唯一のデータベースです。毎日世界中で200万件以上がダウンロードされ、基礎研究から創薬などへの応用まで幅広い研究に活用されています。大阪大学蛋白質研究所の日本蛋白質構造データバンク(Protein Data Bank Japan:PDBj)を含む日米欧の世界4拠点が、国際蛋白質構造データバンク(worldwide Protein Data Bank:wwPDB) という組合を組織して共同で登録・維持・管理を行っています。日本はwwPDBの設立メンバーであり、アジア・中東地区からのデータ処理・登録を分担して、全てのPDBデータを大阪大学から世界に発信( https://pdbj.org )しています (図2) 。

世界中の研究者が構造解析した蛋白質の構造情報は、必ず全て日米欧のいずれかのサイトで事前にデータベースに登録する約束になっています。通常、登録済みPDBデータは、該当の情報を含む研究が論文として発表されるまで非公開とされ、実験のオリジナリティーが担保される仕組みになっています。しかし、蛋白質の構造情報は、立体構造に基づいた創薬研究に積極的に活用される基盤情報であり、新型コロナウイルスの構造情報も、できるだけ早い構造データの蓄積と公開が期待されていました。

抗インフルエンザ薬として有名なザナミビル(商品名リレンザ)やオセルタミビル(商品名タミフル)は、PDBに登録されている立体構造を用いて開発されたものです(参照: https://numon.pdbj.org/mom/113 )。ウイルスがもつ蛋白質の天然基質をまねて薬剤設計することで、創薬研究が加速された例として広く知られています。

研究の内容と成果

新型コロナウイルス(SARS-CoV-2)の蛋白質構造情報の蓄積によって、新型コロナウイルスのより深い理解につながり、立体構造に基づいた創薬研究を加速する可能性があることは、抗インフルエンザ薬の開発例からも明らかです。日米欧の合意の下、我々は新型コロナウイルスの構造情報がデータベースに登録された場合、個別に登録者(研究者)と連絡をとり、論文発表を待たずに即時公開することを強く勧めることにしました(アジア・中東地区のデータ登録者にはPDBjが連絡します)。

新型コロナウイルス(SARS-CoV-2)は中国で発生したこともあり、1月26日に中国の研究者から最初の関連構造情報がPDBjに登録されました。SARS-CoV-2が既知のコロナウイルスとよく似た遺伝子を持っていることに併せて、国際的な分類基準が決定される前に構造データが登録されたこともあり、厳密にSARS-CoV-2の情報だけを抽出することは専門家でも難しい状況でした。我々は、データ検証と編集・登録作業の過程で正確な情報を収集し、SARS-CoV-2と類縁ウイルスを厳密に区別してデータを取り扱っています。そこで創薬研究の加速を支援する目的で、以降登録された新型コロナウイルスSARS-CoV-2の構造情報データのみを正確に集約して、日英中韓の各言語で以下のHPから発信することにしました。

<新型コロナウイルスの構造情報> https://pdbj.org/featured/COVID-19

図2 蛋白質構造データベースの登録地域分担を示す地図
米国はラトガース大学とカリフォルニア大学サンディエゴ校の共同研究チーム(RCSB PDB),欧州はイギリスにある欧州生物情報科学研究所(EMBL-EBI)が拠点となっている。アジアは,大阪大学蛋白質研究所の日本蛋白質構造データバンク(PDBj)が20年に渡り登録拠点として活動している。

本研究成果が社会に与える影響(本研究成果の意義)

新型コロナウイルスの蛋白質構造情報を正確に集約して伝えることにより、創薬研究が加速することが期待されます。また、感染症に対する薬がウイルスの蛋白質を対象に、どのように開発されるのか、一般向けのホームページも準備しました(以下のアドレスで公開中)。これにより、感染症薬の開発に対する理解が非専門家にも理解して頂きやすくなることが期待されます。

新型コロナウイルスの細胞内増殖に関わる蛋白質を対象とした創薬について解説(図3)
<コロナウイルスプロテアーゼのページ>
https://numon.pdbj.org/mom/242
インフルエンザの細胞内増殖に関わる蛋白質を対象とした創薬について解説
<インフルエンザノイラミ二ダーゼのページ>
https://numon.pdbj.org/mom/113
HIVのワクチン開発を目指した蛋白質の構造研究について解説しています

https://numon.pdbj.org/mom/169
<広域中和抗体のページ>
https://numon.pdbj.org/mom/170

図3 新型コロナウイルスのプロテアーゼ(蛋白質分解酵素)の役割と創薬対象としての意味を解説したページ
本解説ページ https://numon.pdbj.org/mom/242 は,既に一般向けに公開中

特記事項

新型コロナウイルス特集ページは,2020年3月11日(水)午前9時(日本時間)にPDBjのホームページ( https://pdbj.org )から一般に公開しました。なお、本データベース関連事業は、科学技術振興機構(JST)バイオサイエンスデータベースセンター(NBDC)の統合化推進プログラムと、医療研究開発機構(AMED)の創薬等先端技術支援基盤プラットフォーム(BINDS)からの競争的研究資金を受けて進められており、文部科学省の共同利用・共同研究拠点活動経費による一部支援を受けています。

研究者のコメント(大阪大学蛋白質研究所栗栖教授)

国際的なデータベースの構築拠点が国内にあり、国際的に広く信頼されている利点を最大限に生かして、正確で使いやすいデータを日本語(中国語,韓国語)で迅速に提供します。平時には、水道や都市ガスのように使えて当たり前だと思われている情報基盤は、緊急事態になればなるほどスピード感をもって、いつも以上の精度で提供することが重要であることを痛感しています。

参考URL

大阪大学 蛋白質研究所HP
http://www.protein.osaka-u.ac.jp

用語説明

新型コロナウイルス感染症(COVID-19)

2019年に中国武漢で発生した新型の感染症で、新型コロナウイルス(Severe Acute Respiratory Syndrome Coronavirus 2:SARS-CoV-2)が直接の原因とされます。日本国内でも感染者数が増えており、色々な対策が打たれていますが、根本的な治療薬の開発が切望されています。

日本蛋白質構造データバンク(Protein Data Bank Japan:PDBj)

日本蛋白質構造データバンク(PDBj:Protein Data Bank Japan)は、2000年に大阪大学蛋白質研究所に共同利用・共同研究拠点活動を担う組織として設置されました。20年にわたりアジア・中東地区からの蛋白質や核酸の立体構造情報を収集・編集・登録し、米国RCSB、BMRBおよび欧州PDBeと協力して、国際的に統一化された一つの蛋白質構造データベース(PDB)として全データを大阪大学から世界に発信しています。

蛋白質構造データベース(Protein Data Bank:PDB)

蛋白質立体構造データベース(Protein Data Bank:PDB)は実験的に決定した生体高分子の3次元構造を保存する世界で唯一のデータベースです。1971年に米国で7つのエントリーからスタートしました。90年代後半になり、登録件数が全世界的に増加したことに伴って、日本には日本蛋白質構造データバンク(PDBj)が、欧州にはProtein Data Bank in Europe(PDBe)が設置されて、国際連携でPDBを維持・管理するようになりました。現在の総登録件数は16万件以上で、毎週250件程度の新規構造が追加されています。

国際蛋白質構造データバンク(worldwide Protein Data Bank:wwPDB)

大阪大学蛋白質研究所に加えて、米国ラトガース大学とカリフォルニア大学サンディエゴ校の共同研究チーム(RCSB PDB)とNMRの実験データを収録するウィスコンシン大学、欧州はイギリスにある欧州生物情報科学研究所(EMBL-EBI)がメンバーとなって共同でPDBデータの登録・維持・管理を行う組合。2003年に正式な協定が結ばれて設立された。日本蛋白質立体構造データバンク(Protein Data Bank Japan:PDBj)はwwPDBの設立メンバーであり、アジア・中東地区からのデータ処理・登録を分担している。年に1回持ち回りで開催される国際運営諮問委員会からの運営指導に従って運営方針が決定される。